import pandas as pd  # 导入Pandas库

# 读取CSV文件，注意文件路径需正确（若文件与脚本同目录，直接写文件名即可）
df = pd.read_csv("sales_data.csv", encoding="utf-8")  # encoding="utf-8"确保中文正常显示
# 查看前5行数据
print("前5行数据：")
print(df.head())
# 查看数据基本信息
print("\n数据基本信息：")
print(df.info())

# 查看数值列的统计摘要
print("\n数值列统计信息：")
print(df.describe())



# 步骤1：查看sales列的缺失值数量（确认问题规模）
print("sales列缺失值数量：", df['sales'].isnull().sum())  # 输出类似：25
# 步骤2：计算sales列的中位数（排除NaN值）
sales_median = df['sales'].median()  # 自动忽略NaN，返回中位数
print("sales列的中位数：", sales_median)  # 输出类似：512.345678
# 步骤3：用中位数填充缺失值
df['sales'] = df['sales'].fillna(sales_median)  # 原地修改DataFrame
# 验证：确认缺失值已处理
print("填充后sales列缺失值数量：", df['sales'].isnull().sum())  # 输出：0

